[Urgente] Ir buscar a ficheiro html todos os links

1. [Urgente] Ir buscar a ficheiro html todos os links

João Pedro Miranda Nascimento
joaonascimento

(usa Ubuntu)

Enviado em 05/11/2010 - 14:35h

Queria saber como faço para ir buscar por exemplo a página do Google todos os links que nela se encontram, é urgente! Por favor, respondam!


  


2. será que entendi?

irado furioso com tudo
irado

(usa XUbuntu)

Enviado em 05/11/2010 - 14:56h

bem.. vc tem uma página do google, cheia de links e quer acessar, baixar, visitar cada um dos links? faça-se mais claro, pls.

http://www.contraditorium.com/2006/02/15/como-fazer-perguntas-inteligentes/


3. Re: [Urgente] Ir buscar a ficheiro html todos os links

João Pedro Miranda Nascimento
joaonascimento

(usa Ubuntu)

Enviado em 05/11/2010 - 15:01h

Bem amigo,

é o seguinte eu dei o caso do google mas poderia ser qualquer outra pagina, o que eu quero mesmo é todos os links de qualquer pagina guardar dentro de um ficheiro. Mas isso é fácil, o problema é mesmo como é que vou ao código html e retiro todos os links!

Pensei o seguinte, como todas as hiperligações começam em <a href e terminam em > fazer um filtro sobre esses caracteres e depois escolher só o link em si!

Estou mesmo a norinha! Sou novo em shell script e é um trabalho importante!


4. grep

irado furioso com tudo
irado

(usa XUbuntu)

Enviado em 05/11/2010 - 15:15h

dentro do script vc pode usar o grep (para achar o http:..); lê-se o arquivo original, gerando-se um arquivo novo:

grep -i http arquivo.original >> arquivo.final




5. Re: [Urgente] Ir buscar a ficheiro html todos os links

João Pedro Miranda Nascimento
joaonascimento

(usa Ubuntu)

Enviado em 05/11/2010 - 15:22h

Amigo não resultou, apenas guarda de novo o ficheiro todo!

Ou seja, cria um ficheiro igual ao outro! Só queria mesmos saber como ler de um html para por exemplo uma variável e depois guardar num ficheiro auxiliar o resto eu sei fazer!


6. não acredito..

irado furioso com tudo
irado

(usa XUbuntu)

Enviado em 05/11/2010 - 15:29h

não é por nada não, é que não acredito mesmo.

ponha no pastebin.com os dois exemplos: arquivo.origem e o arquivo.destino. Depois falamos (talvez na 2a)

nota: tem razão, ficou feio pra kct - risos. Experimente um (ou mais) dêstes:
http://www.google.com.br/search?hl=pt-BR&client=firefox-a&hs=lYl&rls=org.mozilla%3Aen-US...






Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts